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Beschreibung 

Die vorliegende Erfindung betrifft die Gene fiir Riboflaviri-Biosynthese in Piizen, die damit codierten Proteine 
sowie gentechnische Verfahren zur Hersteilung von Riboflavin unter Verwendung dieser Gene und Genproduk- 
5 te. 

Die Hersteilung von Riboflavin durch Fermentation von Pilzen wie Eremothecium ashbyii oder Ashbya 
gossypii ist bekannt (The Merck Index, Windholz et al.. eds. Merck & Co^ Seite 1 183, 1983). 

In der EP 405370 sind Riboflavin-uberproduzierende Bakterienstamme beschrieben, die durch Transforma- 
tion der Riboflavin-Biosynthese-Gene aus Bacillus subtilis erhalten wurden. 
10 Da die Genetik der Riboflavin- Biosyn these in Bakterien und Eukaryonten verschieden ist, sind die oben 
erwahnten Gene aus Bacillus subtilis nicht fur ein rekombinantes Herstellverfahren fiir Riboflavin mit eukaryon- 
tischen Produktionsorganismen wie Ashbya gossypii geeignet 

In einer am 19. 11. 1992 beim Deutschen Patentamt eingereichten Patentanmeldung wurde die Klonierung der 
Riboflavin-Biosynthese Gene der Hefe Saccharomyces cerevisiae beschrieben. 
15 Eine Klonierung der Ashbya gossypii Riboflavin-Biosynthese Gene unter Verwendung der S. cerevisiae 
RIB-Gene mit Qblichen Hybridisierungsmethoden gelang jedoch nicht; offenbar war die Homologie der RIB- 
Gene aus S. cerevisiae und A. gossypii fiir eine Hybridisierung nicht groB genug. 

Es bestand daher die Aufgabe, die Riboflavin-Biosynthese Gene aus einem Eukaryonten zu isolieren, um damit 
ein rekombinantes Herstellverfahren fiir Riboflavin in einem eukaryontischen Produktionsorganismus bereitzu- 
20 stellen. 

Demgemafi wurden in dem Ascomyceten Ashbya gossypii sechs Gene (rib-Gene), die fur Enzyme der Ribofla- 
vin-Biosynthese ausgehend von GTPcodieren,gefunden und isoliert. 
Die Erfindung betrifft die folgenden DNA-Sequenzen: 

DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 2 dargestellten Aminosauresequenz codieren 
25 Oder fiir ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 2, worin eine oder mehrere Aminosau- 
ren deletiert, hinzugefiigt oder durch andere Aminosaurensubstituiert worden sind, ohne die enzymatische 
Wirkung des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 4 dargestellten Aminosauresequenz codieren 
oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 4, worin eine oder mehrere Aminosau- 
30 ren deletiert, hinzugefiigt oder durch andere Aminosauren substituiert worden sind, ohne die enzymatische 
Wirkung des Polypeptids wesentlich zu reduzieren, 

DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 6 dargestellten Aminosauresequenz codieren 
oder fiir ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 6, worin eine oder mehrere Aminosau- 
ren deletiert. hinzugefugt oder durch andere Aminosauren substituiert worden sind, ohne die enzymatische 
35 Wirkung des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen. die fur ein Polypeptid mit der in SEQ ID NO: 8 dargestellten Aminosauresequenz codieren 
oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 8, worin eine oder mehrere Aminosau- 
ren deletiert. hinzugefugt oder durch andere Aminosauren substituiert worden sind, ohne die enzymatische 
Wirkung des Polypeptids wesentlich zu reduzieren. 
40 DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 10 dargestellten Aminosauresequenz codieren 
oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 10. worin eine oder mehrere Aminosau- 
ren deletiert, hinzugefiigt oder durch andere Aminosauren substituiert worden sind, ohne die enzymatische 
Wirkung des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen. die fur ein Polypeptid mit der in SEQ ID NO: 1 2 dargestellten Aminosauresequenz codieren 
45 oder fiir ein Analoges oder Derivat des Polypeptids gemaQ SEQ ID NO: 12. worin eine oder mehrere Aminosau- 
ren deletiert, hinzugefiigt oder durch andere Aminosauren substituiert worden sind, ohne die enzymatische 
Wirkung des Polypeptids wesentlich zu reduzieren. 

Die Gene und ihre Genprodukte (Polypeptide) sind im Sequenzprotokoll mit ihrer Primarstruktur aufgefiihrt 
und haben folgende Zuordnung: 

50 

SEQ ID NO: 1: rib 1 -Gen 

SEQ ID NO: 2: rib 1 -Genprodukt (GTP-cycIohydrolase 11) 
SEQ ID NO: 3: rib2-Gen 

SEQ ID NO: 4: rib 2-Genprodukt (DRAP- Deaminase) 
55 SEQ ID NO: 5: rib3-Gen 

SEQ ID NO: 6: rib 3-Genprodukt (DBP- Synthase) 
SEQ ID NO: 7: rib4-Gen 

SEQ ID NO: 8: rib4-Genprodukt(DMRL-Synthase) 
SEQ ID NO: 9: rib5-Gen 
60 SEQ ID NO: 10: rib 5-Genprodukt (Riboflavin-Synthase) 
SEQIDNO:ll:rib T-Gen 

SEQ ID NO: 12: rib 7-Genprodukt (HTP- Reductase) 

Guanosintriphosphat (GTP) wird durch GTP-Cyclohydrolase 11 (rib 1 -Genprodukt) zu 2,5-Diamino-6-ribosy- 
65 lamino-4-(3H)-pyrimidin-5-phosphat umgewandelt. Diese Verbindung wird anschlieBend durch rib 7-Genpro- 
dukt zu 2,5-Diamino-ribitylamino-2,4 (1 H,3H)-pyrimidin-5-phosphat reduziert und dann durch rib 2-Genprodukt 
zum 5-Amino-6-ribitylamino-2,4 (1 H3H)-pyrimidindion deaminiert. AnschlieBend wird in einer rib 4-Genpro- 
dukt katalysierten Reaktion die C4-Verbindung DBP hinzugefugt und es entsteht 6,7-Dimethyl-8-ribityIlumazin 
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""^jStm'oSS: I 3. 5. 7.9, 1 1 beschrietenc DNA-Ssqoenzen codieren lOr d» Polypep.ide, dk In SEQ ID 

" DSe' DNA-Seauerzen dit fur die verSnderien C»np«>duk.e codieren, and zn den DNA-Sequenzen gemlO 
rH5f.L^fe"J.Sn'lJe°!?e°p6l^lii>^^^^^^^ 

DNA-Sequenzen hybridisieren unter Standardbedingungen mit den in SEQ ID NO. 1, 3. 5, 7. 9. n bescnneoen 
°«:Sdb.d,n,un,.n s,.d beispie,,wei» Te.^^^^^^^^^ ™^^Ke; « u„d g-c J;;^"-"*^^?- ^ 

GenShnik. b"isplelsw=ise in S.mbrook et >L -Molecular Clon.ng', Cold Spnng Harbor Laboratory. 1989. 

:iS%«er.?r?r^V»'d1=« 3. 

quenzen sind im Sequenzprotokoll aufgefuhrt und inn folgenden naher erlautert. 
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Regulationssequenz fur rib 1-Gen: 
SEQ ID NO: 1 Nukleotid 1-242 
Regulationssequenz fur rib 2-Gen: 
SEQ ID NO: 3 Nukleotid 1 -450 
Regulationssequenz fur rib 3-Gen: 
SEQ ID NO: 5 Nukleotid 1-314 
Regulationssequenz fiir rib 4-Gen: 
SEQ ID NO: 7 Nukleotid 1 -270 
Regulationssequenz fur rib 5-Gen: 
SEQ ID NO: 9 Nukleotid 1-524 
Regulationssequenz fiir rib 7-Cen: 
SEQ ID NO: 1 1 Nukleotid 1-352 



Die Regulationssequenzen konnen auch noch in 5'- und/oder 3'-Richtung verkiirzt werden. ohne daB ihre 
'''S^'^'^^ sind in der Regel Fragmente von 30 bis 100, bevorzugt 40 bis 70 

'"^Sr&"g.^%%"s?i;M 

Ben DNA -Seauenzen enthalten. Solche Expressionsvektoren erhalt man. indem man die erfmdungsgemaBen 
DNA Seauenzen mU geiigneten funktionellen Regulationssignalen versieht Solche Regulat.onss.gnale smd 
SSA-SeSi;, Se far dfe Expression verantwortHch sind. beispielsweise Prornoto-n. Operatoren. Enhancer. 

-rg^ne^j^rs^^s^^^^^^^^^^ 
nd^jgtnrnn^^^^^^ 

wfr^or^LSmerzum Gegenstand der Erfindung. Bevorzugt werden als Wirtsorgan.smen eukaryont.sche Or- 

SE^rseSbettigirA^r^iLn^^ 
:~™aESkK;e!^^^^^^^ 

SLs wahreSJderFe^^^^ iebildete Ribonavin aus dem Fermentationsmed.um .soUert und gegebenenfalls 
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gereinigt wird. 

Die rib-Gene und -Genprodukte lassen sich wie im Beispiel und im Sequenzprotokoll beschrieben isoiieren 
und charakterisieren. 

Beispiel 1 

Isoiierung der Ashbya gossypii Riboflavin Biosynthese Gene (rib-Gene) 

a. Konstruktion einer Ashbya gossypii cDNA-Bank 

Gesamt RNA wurde aus dem Mycei des Riboflavin uberproduzierenden Stammes Ashbya gossypii ATCC 
10195 nach Zuchtung auf YEPD Medium (Sherman et al, "Methods in yeast genetics", Coid Spring Harbor, New 
York. 1989) in der spat en logarithmischen Wachstumsphase extrahiert. 

PoIy(A)-»- RNA wurde durch zweimalige Adsorption und Elution an oIigo(dT)-CelluIose gereinigt (Aviv und 
Leder. Proc. NatL Acad. ScL USA 69. 1972, 1408-1412). Die cDNA wurde nach der allgemeinen Vorschrift von 
Gubler und Hoffmann isoIiert(Gene 25, 1983. 263) und synthetische EcoRI-Adaptoren wurden an die Enden der 
bluntend cDNA-MoIekuie hinzugefQgt. Die EcoRI nachgeschnittenen cDNA Fragmente wurden anschlieBend 
mittels T4 Polynukleotidkinase phosphoryliert und in den dephosphorylierten EcoRI geschnittenen Vektor 
pYEura3 kloniert (Fig. 1). pYEura3 (Clonetech Laboratories, Ino, Kalifornien) ist ein Hefe-Expressionsvektor. 
20 der die Galaktose-mduzierbaren GALl und GALlO Promotoren und URA, CEN4 und ARSl beinhaitet Diese 
Hefeeiemente eriauben die Transformation und Expression kionierter DNA-Fragmente in Hefezellen. 

Aliquots der Ligationsreaktion wurden benutzt um hochkompetente (Hanahan, DNA Cloning, ed. D.M 
Glover; IRL Press, Oxford 1985. 109) E. coli XLl-Blue (Bullock et aU Biotechniques 5 (1987) 376-378) zu 
transformieren und Transformanden wurden auf Basis ihrer Ampiciilinresistenz selektioniert 
25 Etwa 3 X 105 ampicillinresistente Zellen wurden vereinigt, amplifiziert und daraus Plasmid-DNA isoliert 
(Birnboim und Doly, Nucleic Acids Res. 7, 1 979, 1 5 1 3). 

b. Isoiierung von Ashbya gossypii cDNA-Klonen. die fQr riboflavinbildende Enzyme codieren 

30 cDNA-KIone von Ashbya gossypii. die fur riboflavinbildende Enzyme codieren. wurden durch funktionelle 
Komplementation von Saccharomyces cerevisiae Mutanten. die in der Rlboflavin-Biosynthese betroffen sind 
isohert. 

Die Stamme AJ88 (Mata leu2 his3 ribl::URA3 ura3-52). AJ115 (Matalpha !eu2 inosl rib2::URA3 ura3-52) 
AJ71 (Matalpha Ieu2 inosl rib3::URA3 ura3-52), AJ106 (Matalpha Ieu2 inosl rib4::URA3 ura3-52). AJ66 (Mata 
35 canR inosi nb5::URA3 ura3-52) und AJ121 (Matalpha leu2 inosl rib7::URA3 ura3-52) sind mutierte Stamme, die 
durch Zerstorung eines der sechs Gene (RIBl bis RIB5 und RIB7X die in die Riboflavinbiosynthese bei Saccharo- 
myces cerevisiae involviert sind. 

Diese Stamme wurden jeweils mit 25 ^ig cDNA aus der Ashbya gossypii cDNA-Bank transformiert und auf 
festem Galaktose-haltigem Medium ohne Riboflavin ausplattiert. Nach ungefahr einer Woche Wachstum wur- 
den Rib + Transformanden von den Kulturschaien isoliert. 

Jewells eine Transformande von jeder transformierten Mutante (RibI +. Rib2 + , Rib3 + . Rib4-I-, Rib5H- und 
Rib7 + ) wurde analysiert und in alien Fallen wurde gefunden, daB der Rib 4- Phanotyp nur in Galaktosemedium, 
nicht jedoch in Glucosemedium exprimiert war. 

Diese Ergebnisse belegen, daB der Rib+ Phanotyp unter der Kontrolle des plasmidstandigen galaktoseindu- 
zierbaren GALIO Promotors exprimiert wurde. 

Plasmid-DNA wurde aus den Ribl +. Rib2 + . Rib3-h, Rib4 + . Rib5-h und Rib7+ Transformanden durch 
Transformation von E. coli isoliert und pJR7l5, pJR669, pJR788. pJR733. pJR681 und pJR827 genannt. 

Partialsequenzierung der in diesen Plasmiden enthaltenen cDNA-Insertionen bestatigte. daB sie fur Proteine 
codieren, die analog zu Proteinen der Rib-Genprodukte aus Saccharomyces sind. 

50 

c. Isoiierung von Ashbya gossypii genomischen Klonen, die fiir riboflavinbildende Enzyme codieren 

Um die genomischen Kopien der riboflavinbildenden Gene von Ashbya gossypii zu isoiieren wurde eine 
genomische Bank von Ashbya gossypii ATCC 10195 in dem Cosmld superCosl (Stratagene Cloning Systems, 
55 Kahfornien) angelegt und mit 32p.markierten Proben, die von den cDNA Kopien der RIBl, RIB2. RIB3. RIB4» 
RIB5 und RIB7 Gene von Ashbya gossypii abgeleitet waren, gescreent 

Cosmid Kione mit RIBl. RIB2. RIB3, RIB4, RIBS und RIB7 DNA wurden isoliert durch Koloniehybridisierung 
(Grunstein und Hogness. Proa Natl. Acad, Sci. USA 72, 1975. 3961-3965), Weitere Southern Analysen von 
enzymatisch gespaltener Cosmid DNA unter Verwendung der gleichen RIB-spezifischen cDNA Proben erlaub- 
60 te die Identifizierung definierter Restriktionsfragmente, die die RIBl, RIB2, RIB3. RIB4, RIBS und RIB7 Gene 
von Ashbya gossypii enthielten. 

Ein 3.1 kb langes BamHI-Clal DNA Fragment wurde gefunden, das das gesamte RIBl Gen von Ashbya 
gossypii. codierend fur GTP-Cyclohydrolase II enthielt Dieses Fragment wurde aus einem Agarose Gel isoliert 
und in den BamHI und Clal geschnittenen pBluescripi KS ( + ) phagemid (Stratagene Cloning Systems) kloniert 
65 undliefertesodas P]asmidpJR765(Fig. 2). 

Eine 1329 bp lange DNA Sequenz wurde erhalten (SEQ ID NO: 1), die den RIBl offenen Leserahmen von 906 
bp, 242 bp von der S'-nichtkodierenden Region und 181 bp von der 3'-nichtkodierenden Region enthielt. 

Das gesamte Ashbya gossypii RIB2 Gen, das fur die DRAP-Deaminase codiert, wurde auf einem 3,0 kb langen 
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der5^untranslat.ert^en Region und 207 bp ^^^^^ 2.5 kb 

Das gesamte Ashbya gossypii RlBo eren, aas rur oie '^'r, p,„-_ij pioTsofp"^^^ 

der 5'-untranslatierten Region und 279 der 3 -untransla lerten k^^^ m auf einem 4,1 kb langen 
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mRNA Analyse der Ashbya gossypii RIB-Gene 
wurde aus dem Ashbya gossypu Stamm ATCC 10195 w e in Bei^^^^^ zusammen mit 

'^;sr^'JL'',^L:i^i'^'^'^'^^^ 

77,1980,5201—5205). . - 32p mi^rifi*»rtpn RIB-soezifischen DNA-Proben 

PJR845 als spezifischer Probe nachgewtesen. 

Beispiel 3 

Expression der Ashbya gossypii RIB-Gene in Saccharomyces cerevisiae 

iragen. d.s for di. kompl=menti»renden Erzym= 7° ''jji^j^^ von S ceivislac- 

'"gSe i„ BeUpiel 1 beschri=b=„» von pYE-r.3 »bs.teU.,e„ Pl^mide e„,hil,,n Ash^^^^^ gossypii RlB-sp.zifi. 

-.y£S?pS=;^^^^^^^^^^ 

""dS z" iSf :r^°S r,:?„'e°°JSSoTM^^^^^ HO. pH 7,5 g.wasch.n und » gl.icben Puft.r. der n,i. ■ 
"^e^'SX JrSS Vo?S^^^^^^ -0 Z=n«oga,ion b=i 30OO g ,«r .0 ™,n. 

Rcduktase Enzymaklivilaten warden besummt WIS in der ^ Bacher.Z. Naturforsch. 35b. 

biol. 124 1980.255- 259; R,cht.r e, a J B««™U 199i . p|,„, 
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galaktoseinduzierbaren GA neuromotors erfolgL 

Daher belegen diese Ergebnisse. daB RIBl fur die GTP-Cyclohydrolase II in Ashbya gossypii codiert. Auf 
analoge Art wurde gezeigt daB R1B2 far DRAP-Deaminase, RIB3 fur DBP-Synthase, RIB4 fur DMRL-Synthase, 
R1B5 fur Ribofiavinsynthase und RIB7 fur HTP-Reduktase in diesem Pilz codiert. 

Tabelle 1 

GTP-Cyclohydroiase II Aktivitat der S. cerevisiae RIB I Mutante AJ88 und ihrer Transformanden 





Plasmid 


GTP-Cyclohydrolase II 
U/mg Protein **) 


Glucose 


Galaktose 


X 2180-lA* 




0^48 


0,34 


AJ 88 




n-d. 


n.d. 


AJ 88 


pIR715 


n.d. 


21, 60 



n.d.: not detected 
*) Wildtyp 

**) Einheiten GTP-Cyclohydrolase II Aktivitaten 

lU katalysiert die Bildung von 1 nmol HTP pro Stunde 



Tabelle 2 

30 

DRAP- Deaminase Aktivitat der S. cerevisiae RIB2 Mutante AJ 1 15 und ihrer Transformanden 



Stamm 


Plasmid 


DRAP-Deaminase 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-lA 




0^45 


0,38 


AJ 115 




n.d. 


n.d. 


AJ 115 


pIR669 


n.d. 


53,22 



n.d. : not detected 

*) lU katalysiert die Bildung von 1 nmol ARAP pro Stunde 



Tabelle 3 

50 

DBP-Synthase Aktivitat der S. cervisiae R1B3 Mutante AJ71 und ihrer Transformanden 



Stamm 


Plasmid 


DBP-Synthase 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-lA 




0,80 


0^75 


AJ 71 




n.d. 


n.d. 


AJ 71 


pIR788 


n.d. 


25,19 



n.d.: not detected 

*) lU katalysiert die Bildung von 1 nmol DBP pro Stunde 
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Tabelle 4 

GTP-Cyclohydrolase II Aktivitat der S. cervisiae RIB4 Mu.ante A106 und ihrer Transformanden 





p 1 A ^mid 


DMRL-Synthase 
U/mg Protein *) 






Glucose 


Gaiaktose 


X 2180-lA 




2,04 


lr73 


AJ 106 






n .d. 


AJ 106 


pIR733 


n.d. 


86,54 
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n.d.rnot detected 

*) lU katalysiert die Bildung von 1 nmol DMRL pro Stunde 

Tabelle 5 

Ribonavin-Synthase Aktivitat der S.cerevisiae RIBS Mutante AJ66 und ihrer Transformande 



Stamm 


Plasmid 


Riboflavin-Synthase 
U/mg Protein *) 


X 2180-lA 
AJ 66 
AJ 66 


pIR681 


Glucose 
4,41 
n.d. 
n.d. 


Galactose 
3,80 
n.d. 
164,20 



n.d.rnot detected 
*) lU katalysiert 



die Bildung von 1 nmol Riboflavin pro Stunde 



HTP 



Tabelle 6 

-Reduktase Aktivitat der S. cerevisiae RIB7 Mutante AJ 1 21 und ihrer Transformande 



Stamm 


Plasmid 


HTP- 
U/mg 


-Reductase 
Protein *) 


X 2180-lA 
A J 121 
AJ 121 


pIR827 


Glucose 
1,86 
n.d. 
n.d* 


Galaktose 
2,54 
n.d. 
46,21 
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di. Bildun, vo. 1 n„ol .HAP pro Stunde 
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SEQUENZPROTOKOLL 

(1) AJLGEMEINE INFORMATION: 
(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) - STRASSE: Carl-Bosch-Strasse 38 

(C) ORT: Ludwigshafen 

(E) LAND: Bxmdesrepublik Deutschland 

(F) POSTLEITZAHL: D-67056 

(G) TELEPHON: 0621/6048526 

(H) TELEFAX: 0621/6043123 

(I) TELEX: 1762175170 

(ii) ANMELDETITEL: Ribof lavin-Biosynthese in Pilzen 
(lii) ANZAKL DER SEQUENZEN: 12 



(iv) COMPUTER- LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC coirpatible 

25 BETRIEBSSYSTEM: PC-DOS/MS-DOS 

tos rr..^r.r.JJ'^ SOFTWARE: PatentIn Release #1,0. Version #1.25 (EPA) 
(2) INFORMATION 2U SEQ ID NO: 1: 
(i> SEQUEN2 CHARAKTERISTIKA: 
30 lANGE: 1329 Basenpaare 

(B) ART: Nukleinsaure 
CC) STRANGFORM: Doppel 
(D) TOPOLOGIE: linear 
35 (ii) ART DES MOLEKULS: cDNS zu mRNS 

Ciii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 
(Vi) URSPRQnLICHE HERKUNFT: 
40 <A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5 'UTR 

(B) LAGE: 1..242 
45 (ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 243.. 1148 
(ix) MERKMALE: 

50 (A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 1149,. 1329 
(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 



^riS!!^^? ATGCTCATCG CACATTGATA ATGTACATTC GAAAAATTTC 

20 
80 

AT ATG APT r.ai. ^r^^T^V"""^'^"''"" '^'"^'-'-^^'■^ -i-rTCTTAATT ACTGAAGCTG 240 
AT ATG ACT GAA TAC ACA GTG CCA GAA GTC AGG TGT GTC GCA CGC GCG 287 



AAOA^.GCC ^CGTGAACA GCGATTTACC S^I^^^ O^^r 120 

AGGTGCTTl^ TCATTCAACA ATCCACGTCG GAATTGGCGA CTATATAGTC TAgS^S^ 180 
JT^S^riS ^----^^-^C AGACCAACTC TTTGTTAATT ACtS^^ 



Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala 
^5 10 15 
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CGC ATA CCG ACG GT^AG GGC ACC GAT GTC TTC CTC CAT CTA TAG CAC 335 
Arg lie Pro Thr Val Gin Gly Thr Asp Val Phe Leu His Leu Tyr His 

20 25 30 

AAC TCG ATC GAC AGO AAG GAA CAC CTA GCG ATT GTC TTC GGC GAG AAC 383 
Asn Ser lie Asp Ser Lys Glu His Leu Ala lie Val Phe Gly Glu Asn 

35 40 45 

ATA CGC TCG CGG AGT CTG TTC CGG TAC CGG AAA GAC GAC ACG CAG CAG 431 
lie Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gin Gin 

50 55 60 

GCG CGG ATG GTG CGG GGC GCC TAC GTG GGC CAG CTG TAC CCC GGG CGG 479 
Ala Arg Met Val Arg Gly Ala Tyr Val Gly Gin Leu Tyr Pro Gly Arg 

65 70 75 

ACC GAG GCA GAC GCG GAT CGG CGT CAG GGC CTG GAG CTG CGG TTT GAT 527 
Thr Glu Ala Asp Ala Asp Arg Arg Gin Gly Leu Glu Leu Arg Phe Asp 
80 85 90 95 

GAG ACA GGG CAG CTG GTG GTG GAG CGG GCG ACG ACG TGG ACC AGG GAG 575 
Glu Thr Gly Gin Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu 

100 105 110 

CCG ACA CTG GTG CGG CTG CAC TCG GAG TGT TAC ACG GGC GAG ACG GCG 623 
Pro Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala 

115 120 125 

TGG AGC GCG CGG TGC GAC TGC GGG GAG CAG TTC GAC CAG GCG GGT AAG 671 
Trp Ser Ala Arg Cys Asp Cys Gly Glu Gin Phe Asp Gin Ala Gly Lys 

130 135 140 

CTG ATG GCT GCG GCG ACA GAG GGC GAG GTG GTT GGC GGT GCG GGG CAC 719 
Leu Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His 

145 150 155 

GGC GTG ATC GTG TAC CTG CGG CAG GAG GGC CGC GGC ATC GGG CTA GGC 7 67 

Gly val He val Tyr Leu Arg Gin Glu Gly Arg Gly He Gly Leu Gly 
160 165 170 175 

GAG AAG CTG PAG GCG TAC AAC CTG CAG GAC CTG GGC GCG GAC ACG GTG 815 
Glu Lys Leu Lys Ala Tyr Asn Leu Gin Asp Leu Gly Ala Asp Thr Val 

180 185 190 

CAG GCG AAC GAG CTG CTC AAC CAC CCT GCG GAC GCG CGC GAC TTC TCG 863 
Gin Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser 

195 200 205 

TTG GGG CGC GCA ATC CTA CTG GAC CTC GGT ATC GAG GAC ATC CGG TTG 911 
Leu Gly Arg Ala He Leu Leu Asp Leu Gly He Glu Asp He Arg Leu 

210 215 220 50 

CTC ACG AAT AAC CCC GAC AAG GTG CAG CAG GTG CAC TGT CCG CCG GCG 9 59 

Leu Thr Asn Asn Pro Asp Lys Val Gin Gin Val His Cys Pro Pro Ala 

225 230 235 

CTA CGC TGC ATC GAG CGG GTG CCC ATG GTG CCG CTT TCA TGG ACT CAG 1007 55 

Leu Arg Cys He Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gin 
240 245 250 255 
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CCC ACA CAG. GGC GT^Rc TCG CGC GAG CTC GAC GGC TAC^^ CGC GCC 1055 
Pro Thr Gin Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala 

260 265 270 

AAG GTC GAG CGC ATG GGG CAC ATG CTG CAG CGG CCG CTG GTG CTG CAC 1103 
Lys Val Glu Arg Met Gly His Met Leu Gin Arg Pro Leu Val Leu His 

275 280 285 

ACG TCT GCG GCG GCC GAG CTC CCC CGC GCC AAC ACA CAC ATA TAATCTTTGC 1155 
Thr Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His He 

290 295 300 

TATATTAAAA CTCTATAAAC GTATGCCACA CGGCGCCCGC GGGCTGCCAC ACGCTGCTCA 1215 
CGGGCTGCCG AACAGTTCTA ACAAGTAATC GCGCGCCTCG CCAGTGATCG TGGCGAGCAC 1275 
15 CTTGTCGTCC ATCATCACAT ATCCTCGGCT ACAGTCGTCG TTGAAGAGCG TGCA 1329 
(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 301 Aminosduren 

(B) ART: Aminosdure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 2: 
Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala Arg 

^5 10 15 

He Pro Thr Val Gin Gly Thr Asp Val Phe Leu His Leu Tyr His Asn 

20 25 30 . 

Ser He Asp Ser Lys Glu His Leu Ala He Val Phe Gly Glu Asn He 

35 40 45 

Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gin Gin Ala 

50 55 60 

Arg Met Val Arg Gly Ala Tyr Val Gly Gin Leu Tyr Pro Gly Arg Thr 
^5 70 75 80 

Glu Ala Asp Ala Asp Arg Arg Gin Gly Leu Glu Leu Arg Phe Asp Glu 

85 90 95 

Thr Gly Gin Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu Pro 

100 105 110 

Thr Leu val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala Trp 

120 125 
Ser Ala Arg Cys Asp Cys Gly Glu Gin Phe Asp Gin Ala Gly Lys Leu 

130 135 140 

Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His Gly 
50 , 150 155 160 

Val He Val Tyr Leu Arg Gin Glu Gly Arg Gly He Gly Leu Gly Glu 

165 170 175 

Lys Leu Lys Ala T/r Asn Leu Gla Asp Leu Gly Ala Asp Thr Val Gin 

180 185 190 

Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser Leu 

195 200 205 

Gly Arg Ala He Leu Leu Asp Leu Gly He Glu Asp He Arg Leu Leu 
60 210 215 220 
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Tlir Asn Asn Pro Aspics Val Gin Gin val His Cys Pro Pro Ala Leu 
225 230 235 240 

Arg Cys He Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gin Pro 

245 250 255 5 

Tlir Gin Gly val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala Lys 

260 265 270 

Val Glu Arg Met Gly His Met Leu Gin Arg Pro Leu Val Leu His Tiir 

275 280 285 »0 

Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His He 

290 295 300 

(2) INFORMATION ZU SEQ ID NO: 3: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGS: 2627 Basenpaare 
(3) ART: Nukleinsaure 

(C) STRANGFORM: Dcppel 

(D) TOPOLOGIE: linear 
(ii) ART DES MOLEKULS: cDNS zu mRNS 

(iii) HYPOTHETISCH : NEXN 
(iii) ANTISENSE: NEXN 

<vi) ORSPRUNLICHE HERKONFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..450 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 451- .2280 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3 'UTR 

(B) LAGE: 2281.. 2627 
(xi) SEQUENZBESCHRSIBUNG: SEQ ID NO: 3: 

CTGCAGGACA ATTTAAATTA CGATTACACG CGGCAGCCTT CTTGGTGCGA CAGGATTTTG 
TACAAGAATG ACCCCAAGCG GGTAAGAGTT CATAGGTATG CCTCGATTGA TAGACGTTCC 120 
ATTTTGAATT ATACTGATCA CGAACCCGTA ACGCTCGATG TCAGCGTTTC ATGCCATACA 180 
CAATTTGTCC CAATGGCTAT GCAGAATATT TCCCCACAGA GCACCATGGA AA'XGTATGTG 240 
GGAGACGTCA CAGATATACT ACTGATGTTG TTCTCCAGAG TATACTACGC CCCTACCATA 3 00 

TTCGATCTTG TGGTATTGAC GATATTCCTC TGTTTGGTTT TACTGGCACT ATTCCGTTTG 3 60 

ACCSGTATAGC GCTATTCGTT CATAGTGACA CATGCGGCAC TAGCTATTCIA GCGAATCCTT 420 
TATAAACTGC TACTTAACGT TCGTAACACC ATG CTC AAA GGC GTT OCT GGC CTT 474 

Met Leu Lys Gly Val Pro Gly Leu 
1 5 

CTT TTT AAG (SAG ACG CAA CGT CAT CTG AAA CCC AGG CTG GTT AGG ATT 522 

Leu Phe Lys Glu Thr Gin Arg His Leu Lys Pro Arg Leu Val Arg lie 55 

10 15 20 

ATG GAA AAC ACA TCG CAG GAT GAG AGT CGC AAA AGA CAG GTC GCT TCG 570 
Met Glu Asn Thr Ser Gin Asp Glu Ser Arg Lys Arg Gin Val Ala Ser 
25 30 35 40 50 
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AAC TTG AGC. AGC G^TOCC GAT GAG GGC TCG CCG GCA GoK^G AGG CCG 

Asn Leu Ser Ser Asp Ala Asp Glu Gly Ser Pro Ala Val Thr Arg Pro 

45 50 55 

GTT AAA ATC ACC AAA CGC CTC AGG AAG AAG AAC CTC GGG ACA GGC GAG 666 
Val Lys He Thr Lys Arg Leu Arg Lys Lys Asn Leu Gly Thr Gly Glu 

60 65 70 

CTA CGG GAC AAA GCA GGA TTC AAG TTG AAG GTG CAA GAC GTG AGC AAA 714 
Leu Arg Asp Lys Ala Gly Phe Lys Leu Lys Val Gin Asp Val Ser Lys 

75 80 85 

AAC CGT CAC AGA CAG GTC GAT CCG GAA TAC GAA GTC GTG GTA GAT GGC 762 
Asn Arg His Arg Gin Val Asp Pro Glu Tyr Glu Val Val Val Asp Gly 
15 90 95 100 

CCG ATG CGC AAG ATC AAA CCG TAT TTC TTC ACA TAC AAG ACT TTC TGC 810 
Pro Met Arg Lys lie Lys Pro Tyr Phe Phe Thr Tyr Lys Tlir Phe Cys 
105 110 115 120 

AAG GAG CGC TGG AGA GAT CGG AAG TTG CTT GAT GTG TTT GTG GAT GAA 858 
Lys Glu Arg Trp Arg Asp Arg Lys Leu Leu Asp Val Phe Val Asp Glu 

125 130 135 

TTT CGG GAC CGC GAT AGG CCT TAC TAC GAG AAA GTC ATC GGT TCG GGT 906 
Phe Arg Asp Arg Asp Arg Pro Tyr Tyr Glu Lys Val He Gly Ser Gly 

140 145 150 

GGT GTG CTC CTG AAC GGT AAG TCA TCG ACG TTA GAT AGC GTA TTG CGT 954 
Gly val Leu Leu Asn Gly Lys Ser Ser Thr Leu Asp Ser Val Leu Arg 
30 155 160 165 

AAT GGA GAC CTC ATT TCG CAC GAG CTG CAC CGT CAT GAG CCA CCG GTC 
Asn Gly Asp Leu He Ser His Glu Leu His Arg His Glu Pro Pro Val 

170 175 180 

TCC TCT AGG CCG ATT AGG ACG GTG TAC GAA GAT GAT GAC ATC CTG GTG 
Ser Ser Arg Pro He Arg Thr Val Tyr Glu Asp Asp Asp He Leu Val 
185 190 195 200 

ATT GAC AAG CCC AGC GGG ATT CCA GCC CAT CCC ACC GGG CGT TAC CGC 1098 
He Asp Lys Pro Ser Gly He Pro Ala His Pro Thr Gly Arg Tyr Arg 

205 210 215 

TTC AAC TCC ATT ACG AAA ATA CTT GAA AAA CAG CTT GGA TAC ACT GTT 1146 
Phe Asn Ser He Thr Lys He Leu Glu Lys Gin Leu Gly Tyr Thr Val 

220 225 230 

CAT CCA TGT AAC CGA CTG GAC CGC CTA ACC AGT GGC CTA ATG TTC TTG 1194 
His Pro Cys Asn Arg Leu Asp Arg Leu Thr Ser Gly Leu Met Phe Leu 

235 240 245 

GCA AAA ACT CCA AAG GGA GCC GAT GAG ATG GGT GAT CAG ATG AAG GCG 1242 
Ala Lys Thr Pro Lys Gly Ala Asp Glu Met Gly Asp Gin Met Lys Ala 

250 255 260 

CGC GAA GTG AAG AAA GAA TAT GTT GCC CGG GTT GTT GGG GAA TTT CCT 12 90 

Arg Glu Val Lys Lys Glu Tyr Val Ala Arg Val Val Gly Glu Phe Pro 

270 275 280 
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ATA GGT GAG. ATA GTT^G GAT ATG CCA CTG AAG ACT ATA CCG AAG 1338 

lie Gly Glu lie Val Val Asp Met Pro Leu Lys Thr He Glu Pro Lys 

285 290 295 

CTT GCC CTA AAC ATG GTT TGC GAC CCG GAA GAC GAA GCG GGC AAG GGC 1386 5 

Leu Ala Leu Asa MeC Val Cys Asp Pro Glu Asp Glu Ala Gly Lys Gly 

300 305 310 

GCT AAG ACG CAG TTC AAA AGA ATC AGC TAG GAT GGA CAA ACG AGC ATA 1434 
Ala Lys Thr Gin Phe Lys Arg He Ser Tyr Asp Gly Gin Thr Ser He lo 

315 320 325 

GTC AAG TGC CAA CCG TAG ACG GGC CGG ACG CAT CAG ATC CGT GTT CAC 1482 
val Lys cys Gin Pro Tyr Thr Gly Arg Thr His Gin He Arg Val His 

330 335 340 'S 

TTG CAA TAG CTG GGC TTC CCA ATT GCC AAC GAT CCG ATT TAT TCC AAT 1530 
Leu Gin tyr Leu Gly Phe Pro He Ala Asn Asp Pro He lyr Ser Asa 
345 350 355 360 

CCG CAC ATA TGG GGC CCA AGT CTG GGC AAG GAA TGC AAA GCA GAC TAG 1578 20 

oro His He Trp Gly Pro Ser Leu Gly Lys Glu Cys Lys Ala Asp Tyr 

365 370 375 

AAG GAG GTC ATC CAA AAA CTA AAC GAA ATT GGT AAG ACT AAA TCT GCG 1626 
Lys Glu Val He Gin Lys Leu Asn Glu He Gly Lys Thr Lys Ser Ala 

380 385 390 

GAA AGT TGG TAC CAT TCT GAT TCC CAA GGT GAA GTT TTC AAA GGG GAA 1674 
Glu Ser Trp Tyr His Ser Asp Ser Gin Gly Glu Val Phe Lys Gly Glu 

395 400 405 

CAA TGC GAT GAA TGT GGC ACC GAA CTG TAC ACT GAC CCG GGC CCG AAT 
Gin Cys Asp Glu Cys Gly Thr Glu Leu Tyr Thr Asp Pro Gly Pro Asn 

410 ~ 415 420 

GAT CTT GAC TTA TGG TTG CAT GCA TAT CGG TAT GAA TCC ACT GAA CTG 1770 
2^sp Leu Asp Leu Trp Leu His Ala Tyr Arg Tyr Glu Ser Thr Glu Leu 
425 430 435 440 

GAT GAG AAC GGT GCT AAA AAG CGG AGT TAC TCT ACT GCG TTT CCT GAG 1818 
Asp Glu Asn Gly Ala Lys Lys Arg Ser Tyr Ser Thr Ala Phe Pro Glu 

445 450 455 

TGG GCT CTT GAG CAG CAC GGC GAC TTC ATG CGG CTT GCC ATC GAA CAG 
Trp Ala Leu Glu Gin His Gly Asp Phe Met Arg Leu Ala He Glu Gin 

460 455 470 

GCT AAG AAA TGC CCA CCC GCG AAG AC A TCA TTT AGC GTT GGT GCC GTG 1914 
Ala Lys Lys Cys Pro Pro Ala Lys Thr Ser Phe Ser Val Gly Ala Val 

475 480 485 

TTA GTT AAT GGG ACC GAG ATT TTG GCC ACT GGT TAC TCA CGG GAG CTG 19 62 

Leu Val Asn Gly Thr Glu He Leu Ala Thr Gly Tyr Ser Arg Glu Leu 

490 495 500 

GAA GGC AAC ACG CAC GCT GAA CAA TGT GCA CTT CAA AAA TAT TTT GAA 2010 
Glu Gly Asn Thr His Ala Glu Gin Cys Ala Leu Gin Lys Tyr Phe Glu 
505 510 515 520 
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S^fevG GTT CCT ATT GGT ACA GTA AtI^^C 



CAA CAT AAA, ACC G^^AG GTT CCT ATT GGT ACA GTA ATJPRc ACG ACT 2058 
Gin His Lys Thr Asp Lys Val Pro lie Gly Thr Val lie Tyr Thr Thr 

525 530 535 

ATG GAG CCT TGT TCT CTC CGT CTC AGT GGT AAT AAA CCG TGT GTT GAG 2106 
Met Glu Pro Cys Ser Leu Arg Leu Ser Gly Asn Lys Pro Cys Val Glu 

540 545 550 

CGT ATA ATC TGC CAG CAG GGT AAT ATT ACT GCT GTT TTT GTT GGC GTA 2154 
Arg He He Cys Gin Gin Gly Asn He Thr Ala Val Phe Val Gly Val 

555 560 565 

CTT GAG CCA GAC AAC TTC GTG AAG AAC AAT ACA AGT CGT GCG CTA TTG 2202 
Leu Glu Pro Asp Asn Phe Val Lys Asn Asn Thr Ser Arg Ala Leu Leu 
15 570 575 580 

GAA CAA CAT GGT ATA GAC TAT ATT CTT GTC CCT GGG TTT CAA GAA GAA 2250 
Glu Gin His Gly He Asp Tyr He Leu Val Pro Gly Phe Gin Glu Glu 
585 590 595 600 

TGT ACT GAA GCC GCA TTG AAG GGT CAT TGATTTTGCT GCGAATTGTA 2297 
Cys Thr Glu Ala Ala Leu Lys Gly His 

605 610 
GATGACTTAA AATATCGAGG CGTATAATTC GTCGCATTTT ATATAGTTAT CTATGTTTAC 2357 
ATGACTGTTT AAGCTTGATC TATATTTCTC AAGTGAATTG CCACATATGT TGGTACGGTA 2417 
ATAAATTAAT GAGGGAGTTT TGAAATTCGC AACCAATCTT ATATACGTTT GATGATATAA 2477 
ACGGATTGAG ATTCATTAAG CTACCTGATT TTCGCTGAAC TGTTTGTTAT AGGTTTTTAC 2537 
AGTAAGATAG TTCCTAAGTT TGTTTATTGT CCCCAGTCGG CCAATTGTTC CGGACTTATT 2597 
30 ATTATTACCA TTAGTGGTGT TAGTAGTATT 
(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE; 609 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Leu Lys Gly Val Pro Gly Leu Leu Phe Lys Glu Thr Gin Arg His 

^5 10 15 

Leu Lys Pro Arg Leu Val Arg He Met Glu Asn Thr Ser Gin Asp Glu 

20 25 30 

Ser Arg Lys Arg Gin Val Ala Ser Asn Leu Ser Ser Asp Ala Asp Glu 

35 40 45 

Gly Ser Pro Ala Val Thr Arg Pro Val Lys He Thr Lys Arg Leu Arg 

50 55 60 

Lys Lys Asn Leu Gly Thr Gly Glu Leu Arg Asp Lys Ala Gly Phe Lys 
^5 70 75 80 

Leu Lys Val Gin Asp Val Ser Lys Asn Arg His Arg Gin Val Asp Pro 

85 90 95 

Glu Tyr Glu Val Val Val Asp Gly Pro Met Arg Lys He Lys Pro Tyr 

100 105 110 

Phe Phe Thr Tyr Lys Thr Phe Cys Lys Glu Arg Trp Arg Asp Arg Lys 

120 125 



2627 



60 



65 



14 



eNSDOCID:<DE 44207e5Al> 









i 




44 ZV /oD 


A 1 

Al 












XjOU 


Asp 


Val 


Phe 


val 
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Glu 


Phe 


Arg 


Asp 


Arg 


Asp 


Arg 


Pro 


Tyr 
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Glu 
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Val 
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Gly 


ser 


Gly 


Gly Val 


Leu 


Leu 


Asn 


Gly 


Lys 


Ser 
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150 










155 










160 




Thr 


Lieu 


Asp 


ser 


Val 


Leu Arg Asn Gly Asp 


Leu 


He 


Ser 


His 


Glu 










165 










170 










175 




Leu 


His 


Arg 


His 


Glu 


Pro 


Pro 


Val 


Ser 


Ser 


Arcr 


Pro 


He 


Arg 


Thr 


Val 








180 










185 
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190 






Ay J- 


Glu 




Asp 


Asp 


He 


Leu 


Val 


He 


Aso 


Lys 


Pro 


Ser 


Gly 


He 


Pro 




195 










200 










205 








Ala 


His 


Pro 


Thr 


Gly 


Arg 


Tvr 


Arci 


Phe 


Asn 


Ser 


He 


Thr 


Lys 


He 


Leu 




210 










215 










220 










Glu 


Lys 


Gin 


Leu 


Gly 


Ty^ 


Thr 


val 


His 


Pro 


Cys 


Asn 


Arg 


Leu 


Asp 


Arg 










230 










235 










240 




Thx 


Ser 


Glv 


Leu 


Met 


Phe 


Leu 


Ala 


Lvs 


Thr 


Pro 


Lys 


Gly 


Ala 


Asp 










245 










250 










255 




Glu 


Met 


Glv 


ASD 


Gin 


Met 




Ala 


Aro 


Glu 


Val 


Lys 


Lys 


Glu 


Tyr 


Val 








260 










^ O «^ 










270 






Ala 


Arc 


val 


Val 


Gly 


Glu 








Glv 


Glu 


He 


val 


Val 


Asp 


Met 
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o Q n 










285 








Pro 


Leu 


LVS 


Thr 


He 


Glu 


Pro 


Liys 


Leu 


ivxa 




Asn 


Met 


val 


Cys 


Asp 




290 








295 










300 










Pro 


Glu 


Asp 


Glu 


Ala 


Gly 


Lys 


uxy 


A-LcL 






Gin 


Phe 


Lys 


Arg 


He 


J w w 








310 




















320 






Asp 


Glv 


Gin 


Thr 


Ser 




V cLi. 






Gin 


Pro 


Tyr 


Thr 


Gly 








325 










0 
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335 






Tbx 


His 


Gin 


He 


Arg 


Val 




Leu 


Gin 




Leu 


Gly 


Phe 


Pro 


He 








340 










345 










350 






Ala 


Asil 


Asp 


Pro 


He 


Tyr 


Ser 


Asn 


Pro 


His 


He 


Trp 


Gly 


Pro 


Ser 


Leu 






355 










360 










365 








GlV 


LVS 


Glu 


Cys 


Lys 


Ala Asp 


Tyr 


Lys 


Glu 


Val 


He 


Gin 


Lys 


Leu 


Asn 




370 










375 










380 










Glu 


lie 


Gly 


Lys 


Thr 


Lys 


Ser 


Ala 


Glu 


Ser 


Trp 


Tyr 


His 


Ser 


Asp 


Ser 


385 










390 










395 










400 


Gin 


Gly 


Glu 


Val 


Phe 


Lys 


Gly 


Glu 


Gin 


Cys 


Asp 


Glu Cys 


Gly 


Thr 


Glu 










405 










410 










415 




Lieu 


TVr 


Thr 


Asp 


Pro 


Gly 


Pro 


Asn 


Asp 


Leu 


Asp 


Leu 


Trp 


Leu 


His 


Ala 








420 










425 










430 








Arc 


Tvr 


Glu 


ser 


Thr Glu Leu Asp Glu Asn Gly Ala Lys 


Lys 


Arg 
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440 










445 








Ser 


Tyr 


Ser 


Thr 


Ala 


Phe 


Pro 


Glu Trp 


Ala 


Leu 


Glu 


Gin 


His 


Gly 


Asp 




450 










455 










460 










Phe 


Met 


Arg 


Leu 


Ala 


He 


Glu 


Gin 


Ala 


Lys 


Lys 


Cys 


Pro 


Pro 


Ala 


Lys 


465 










470 










475 










480 


Thr 


ser 


Phe 


Ser 


Val 


Gly 


Ala 


Val 


Leu 


Val 


Asn Gly 


Thr 


Glu 


He 


Leu 



485 490 495 
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Ala Thr Gly, lyr sft^g Glu Leu Glu Gly Asn Thr Hi^la Glu Gin 

500 505 510 

Cys Ala Leu Gin Lys Tyr Phe Glu Gin His Lys Thr Asp Lys Val Pro 
5 515 520 525 

He Gly Thr Val He Tyr Thr Thr Met Glu Pro Cys Ser Leu Arg Leu 

535 540 
ser Gly Asn Lys Pro Cys Val Glu Arg lie He Cys Gin Gin Gly Asn 
»o 545 550 555 

He Thr Ala Val Phe Val Gly Val Leu Glu Pro Asp Asn Phe Val Lys 

565 570 575 

Asn Asn Thr Ser Arg Ala Leu Leu Glu Gin His Gly Xle Asp Tyr He 
*5 580 585 590 

Leu val Pro Gly Phe Gin Glu Glu Cys Thr Glu Ala Ala Leu Lys Gly 

600 605 

His 

20 

(2) INFORMATION ZU SEQ ID NO: 5: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) lAngE: 1082 Basenpaare 

(B) ART: NuJdeinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii> ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH : NEIN 
(iii) ANTISENSE: NEIN 

(Vi) DRSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..314 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 315. .953 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 954.. 1082 
(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5 



40 



45 



CCCTTCTTC3C ACGGTCGTTT CTGAAACTCT ACGATTATTG GAACAATGAG TAAGTCCTCA 60 
^ AATGTACCAC CTATCTGTAG TTTACTATCG GATTTACTGG CTAAGAGCTG ACCTCTTAGG 120 

SitS^^^? ^^i^f^!^ GCCAGCAGGT TGGGCTACCA AGGATAGTTG ATGACTTCCA 180 

240 
300 



TCACCTATAA AAGCGGCTTG AGTGCTTTTG CAATGATTCT GTTCACATGA TGGACAAGAA 
ATACGTACAA AAATTTCAAC GTTTTACAAG TTCCCAAGCT TAGTCAACTC ATCACCAACG 
ACAAACCAAG CAAC ATG ACA AGC CCA TGC ACT GAT ATC GGT ACC GCT ATA 3S0 
Met Thr Ser Pro Cys Thr Asp He Gly Thr Ala He 
^5 10 
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GAG CAG TTC. AAG CAA^^T AAG ATG ATC ATC GTC ATG GAG ^AC ATC TCG 398 
Glu Gin Phe Lys Gin Asn Lys Met lie He Val Met: Asp His He Ser 

15 20 25 

AGA GAA AAC GAG GCC GAT OTA ATA TGT GCA GCA GCG CAC ATG ACT GCC 446 
Arg Glu Asn Glu Ala Asp Leu lie Cys Ala Ala Ala His Met Thr Ala 

30 35 40 

GAG CAA ATG GCA TTT ATG ATT CGG TAT TCC TCG GGC TAC GTT TGC GCT 4 94 

Glu Gin Met Ala Phe Met lie Arg Tyr Ser Ser Gly Tyr Val Cys Ala 
45 50 55 60 

CCA ATG ACC AAT GCG ATT GCC GAT AAG CTA GAC CTA CCG CTC ATG AAC 542 
Pro Met Thr Asn Ala He Ala Asp Lys Leu Asp Leu Pro Leu Met Asn 

65 70 75 

ACA TTG AAA TGC AAG GCT TTC TCC GAT GAC AGA CAC AGC ACT GCG TAT 590 
Thr Leu Lys Cys Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr 

80 85 90 

ACA ATC ACC TGT GAC TAT GCG CAC GGG ACG ACG ACA GGT ATC TCC GCA 638 
Thr He Thr Cys Asp Tyr Ala His Gly Thr Thr Thr Gly He Ser Ala 

95 100 105 

CGT GAC CGG GCG TTG ACC GTG AAT CAG TTG GCG AAC CCG GAG TCC AAG 686 
Arg Asp Arg Ala Leu Thr Val Asn Gin Leu Ala Asn Pro Glu Ser Lys 

110 115 120 

GCT ACC GAC TTC ACG AAG CCA GGC CAC ATT GTG CCA TTG CGT GCC CGT 734 
Ala Thr Asp Phe Thr Lys Pro Gly His He Val Pro Leu Arg Ala Arg 
125 130 135 140 

GAC GGC GGC GTG CTC GAG CGT GAC GGG CAC ACC GAA GCG GCG CTC GAC 782 
Asp Gly Gly Val Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp 

145 150 155 

TTG TGC AGA CTA GCG GGT GTG CCA GAG GTC GCT GCT ATT TGT GAA TTA 830 
Leu Cys Arg Leu Ala Gly Val Pro Glu Val Ala Ala He Cys Glu Leu 

160 165 170 

GTA AGC GAA AGG GAC GTC GGG CTG ATG ATG ACT TTG GAT GAG TGT ATA 878 
Val Ser Glu Arg Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys He 

175 180 185 

GAA TTC AGC AAG AAG CAC GGT CTT GCC CTC ATC ACC GTG CAT GAC CTG 926 
Glu Phe Ser Lys Lys His Gly Leu Ala Leu He Thr Val His Asp Leu 

190 195 200 

AAG GCT GCA GTT GCC GCC AAG CAG TAGACGGCAA CGAGTTCTTT AAGTCGGTGT 9 80 

Lys Ala Ala Val Ala Ala Lys Gin 

205 210 50 

TCATTTATGT AATATACCAT TTCATCGAAA AAGTCAAATG GTATGAACTA GATTTATCAA 1040 
TAGTATCTAA GAGTTATGGT ATTCGCAAAA GCTTATCGAT AC 1082 
(2) INFORMATION ZV SEQ ID NO: 6: 

(i) SEQUEMZ CHARAKTERXSTIKA: 55 

(A) LANGE: 212 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(xi) SEQUSH6eSCHREIBUNG: SEQ ID NO: 6: 
Met Thr Ser Pro Cys Thx Asp lie Gly Thr Ala lie Glu Gin Phe Lys 

^5 10 15 

Gin Asn Lys Met lie He Val Met Asp His He Ser Arg Glu Asn Glu 

20 25 30 

Ala Asp Leu lie Cys Ala Ala Ala His Met Thr Ala Glu Gin Met Ala 

35 40 45 

Phe Met He Arg Tyr Ser Ser Gly Tyr Val Cys Ala Pro Met Thr Asn 

50 55 60 

Ala He Ala Asp Lys Leu Asp Leu Pro Leu Met Asn Thr Leu Lys Cys 
.^5 70 75 80 

Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr Thr He Thr Cys 

85 90 95 

Asp Tyr Ala His Gly Thr Thr Thr Gly He Ser Ala Arg Asp Arg Ala 

100 105 110 

Leu Thr Val Asn Gin Leu Ala Asn Pro Glu Ser Lys Ala Thr Asp Phe 

115 120 125 

Thr Lys Pro Gly His He Val Pro Leu Arg Ala Arg Asp Gly Gly Val 

130 135 140 

Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp Leu Cys Arg Leu 
145 150 155 .160 

Ala Gly Val Pro Glu Val Ala Ala He Cys Glu Leu Val Ser Glu Arg 

165 170 175 

Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys He Glu Phe Ser Lys 

180 185 190 

Lys His Gly Leu Ala Leu He Thr Val His Asp Leu Lys Ala Ala Val 

195 200 205 

Ala Ala Lys Gin 
210 

(2) INFORMATION 2U SEQ ID NO: 7: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 996 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtJTLS: cDNS zu mRNS 
(iii) HYPOTHETISCH: KEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMDS: Ashbya gossypii 

Ux) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..270 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 271,. 789 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 790 . .996 

(xi) SEQUENZ3SSCHREIBUNG: SEQ ID NO: 7: 
TGGTATAATG ATACAGGAAG TGAAAATCCG AAAGGTTCAG ACGATGAAAA GAGTTTGAGA 60 
CGCATCAATG ATCAGCTTTG AGCTATATGT AAGTCTATTA ATTGATTACT AATAGCAATT 120 
TATGGTATCC TCTGTTCTGC ATATCGACGG TTCTCACGTG ATGATCAGCT TGAGGCTTCG 180 
CGGATAAAGT TCCATCGATT ACTATAAAAC CATCACATTA AACGTTCACT ATAGGCATAC 240 
ACACAGACTA AGTTCAAGTT AGCAGTGACA ATG ATT AAG GGA TTA GGC GAA GTT . 294 

Met lie Lys Gly Leu Gly Glu Val 
15 

GAT CAA ACC TAC GAT GCG AGC TCT GTC GAG GTT GGC ATT GTC CAC GCG 342 
Asp Gin Thr Tyr Asp Ala Ser Ser Val Glu Val Gly He Val His Ala 

10 15 20 

AGA TGG AAC AAG ACT GTC ATT GAC GCT CTC GAC CAA GGT GCA ATT GAG 390 
Arg Trp Asn Lys Thr Val He Asp Ala Leu Asp Gin Gly Ala He Glu 
25 30 35 40 

AAA CTG CTT GCT ATG GGA GTG AAG GAG AAG AAT ATC ACT GTA AGC ACC 438 
Lys Leu Leu Ala Met Gly Val Lys Glu Lys Asn He Thr Val Ser Thr 

45 50 55 

GTT CCA GGT GCG TTT GAA CTA CCA TTT GGC ACT CAG CGG TTT GCC GAG 486 
Val Pro Gly Ala Phe Glu Leu Pro Phe Gly Thr Gin Arg Phe Ala Glu 

60 65 70 

CTG ACC AAG GCA AGT GGC AAG CAT TTG GAC GT-G GTC ATC CCA ATT GGA 534 
Leu Thr Lys Ala Ser Gly Lys His Leu Asp Val Val He Pro He Gly 

75 80 85 

GTC CTG ATC AAA GGC GAC TCA ATG CAC TTT GAA TAT ATA TCA GAC TCT 582 
Val Leu He Lys Gly Asp Ser Met His Phe Glu Tyr He Ser Asp Ser 

90 95 100 

GTG ACT CAT GCC TTA ATG AAC CTA CAG AAG AAG ATT CGT CTT CCT GTC 630 
Val Thr His Ala Leu Met Asn Leu Gin Lys Lys He Arg Leu Pro Val 
105 110 115 120 

ATT TTT GGT TTG CTA ACG TGT CTA ACA GAG GAA CAA GCG TTG ACA CGT 678 
He Phe Gly Leu Leu Thr Cys Leu Thr Glu Glu Gin Ala Leu Thr Arg 

125 130 135 

GCA GGC CTC GGT GAA TCT GAA GGC AAG CAC AAC CAC GGT GAA GAC TGG 726 
Ala Gly Leu Gly Glu Ser Glu Gly Lys His Asn His Gly Glu Asp Trp 

140 145 150 

GGT GCT GCT GCC GTG GAG ATG GCT GTA AAG TTT GGC CCA CGC GCC GAA 774 50 

Gly Ala Ala Ala Val Glu Met Ala Val Lys Phe Gly Pro Arg Ala Glu 

155 160 165 

CAA ATG AAG AAG TGAATATTAA AAAATCACTA CTTAAAATTA ACGTTTTTAT 826 
Gin Met Lys Lys 
170 

TATGTCTATA TCAAATTCTT ACGTGATAAC TTTTGATTTC GCTTCCTGGA TTGGCGCAAG 886 
GCCTCCCTGT GTCGCAGTTT TTGTTCACGG GTCCACACAG CTCTGTTTTC CCAGAACATA 946 
TCCTCCCAGC CGGCGAACCG GTTAGACGCT TCTGCTGGCG TTCTTATTTT 996 60 
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(2) INFORMAT^OT ZU SEQ ID NO: 8: 

(i) SEQUSNZ CHARAKTERISTIKA: 

(A) LANGE; 172 Aminosauren 

(B) ART: Aminos^ure 
(D)- TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO- 8- 
Met lie I.ys Gly Leu Gly Glu Val Asp Gin Thr Tyr Asp Ala Ser Ser 

^ 10 15 

val Glu Val Gly He Val His Ala Arg Trp Asn Lys Ttir Val He Asp 

r 30 
Ala Leu ASP Gin Gly Ala He Glu Lys Leu Leu Ala Met Gly Val Lys 

35 40 45 

Glu Lys Asn He Thr Val Ser Thr Val Pro Gly Ala Phe Glu Leu Pro 

^ 5^ 55 60 

Phe Gly Thr Gin Arg Phe Ala Glu Leu Thr Lys Ala Ser Gly Lys His 
^5 70 75 



80 



Leu ASP val Val He Pro He Gly Val Leu He Lys Gly Asp Ser Met 



95 



85 90 
His Phe Glu Tyr He Ser Asp Ser Val Thr His Ala Leu Met Asn Leu 

100 105 110 

Gin Lys Lys He Arg Leu Pro Val He Phe Gly Leu Leu Thr Cys Leu 

115 120 125 

Thr Glu Glu Gin Ala Leu Thr Arg Ala Gly Leu Gly Glu Ser Glu Gly 

130 135 140 

Lys His Asn His Gly Glu Asp Trp Gly Ala Ala Ala Val Glu Met Ala 

155 160 
Val Lys Phe Gly Pro Arg Ala Glu Gin Met Lys Lys 

165 170 
(2) INFORMATION ZU SEQ ID NO: 9: 
(i) SEQUENZ CHARAKTERISTIKA: 

{A} LANGE: 1511 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: CDNS zu mRNS 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(Vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1, .524 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 525, ,1232 
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V 

(ix) MERKMAIiE: 

(A) NAME/SCHLUSSEL: 3 'UTR 

(B) lAGE: 1233.. 1511 
(xi) SEQUENZBESCHREI3UNG: SEQ XD NO: 9: 

TGTATTCAAC CTGGAGGATA ACGAAATTTC CATGGCGCGG GCGATACCAA CCCACAGGAG 60 
CCAGATATAA GACCAATCCC GGCGGGTGTG CCAGCCGCCA TCAGAGACAG CGGGCCAGCA 12 0 

AGGCATGTGA AGTCAAAAGG CGCCAGCTCC T-TATCCGCTC CCGCACAAGC AGGACCGGCA 180 
TATCCCGATG AGCGCGCCAG CACCCAGACG CTACACCACC ATTCGAAGTA GACTTTAAAA 240 
GAGCGCTTTC CAGCTTCTCA GGCAGTTAGC TCTACGACAA AGGAACCAAG TGATTTTCCC 300 
GATAGACGCG ACTTGCTCAA CGATGTTTCT GTGACCAGCG CAAGGAGAGA TAGTCCTAAA 360 
GTATAATCAG ATAGTTAGTC GTATCTTCTA GTTTTATrAG TCAGCTACAT GGCGAACCGC 420 
CATTTCCTTA TGCATGTCTT ACGAGTTTAA AAAGCTCGCG GTAGCAGAAA AGAAGATGCA 480 
TAGATGGCAT ACCGAAGCCT ATATCGCCCA TAGAAGTTGA TAGG ATG TTT ACC GGT 536 

Met Phe Thr Gly 
1 

ATA GTG GAA CAC AIT GGC ACT GTT GCT GAG TAG TTG GAG AAC GAT GCC 584 
iTe val Glu His lie Gly Thr Val Ala Glu Tyr Leu Glu Asn Asp Ala 
*5 10 15 20 

AGC GAG GCA GGC GGC AAC GGT GTG TCA GTC CTT ATC AAG GAT GCG GCT 632 
Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu lie Lys Asp Ala Ala 

25 30 35 

CCG ATA CTG GCG GAT TGC CAC ATC GGT GAC TCG ATT GCA TGC AAT GGT 
pro lie Leu Ala Asp Cys His lie Gly Asp Ser He Ala Cys Asn Gly 

40 45 50 

ATC TGC CTG ACG GTG ACG GAG TTC ACG GCC GAT AGC TTC AAG GTC GGG 72 8 

He Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser Phe Lys Val Gly 

55 60 65 35 

ATC GCA CCA GAA ACA GTT TAT CGG ACG GAA GTC AGC AGC TGG AAA GCT 776 
He Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser Ser Trp Lys Ala 

70 75 80 

GGC TCC AAG ATC AAC CTA GAA AGG GCC ATC TCG GAC GAC AGG CGC TAC 824 
Gly Ser Lys He Asn Leu Glu Arg Ala He Ser Asp Asp Arg Arg Tyr 
85 90 95 100 

GGC GGG CAC TAC GTG CAG GGC CAC GTC GAC TCG GTG GCC TCT ATT GTA 872 

Gly Gly His Tyr Val Gin Gly His Val Asp Ser Val Ala Ser He Val 45 

105 110 115 

TCC AGA GAG CAC GAC GGG AAC TCT ATC AAC TTT AAG TTT AAA CTG CGC 920 
Ser Arg Glu His Asp Gly Asn Ser He Asn Phe Lys Phe Lys Leu Arg 

120 125 130 50 

GAT CAA GAG TAC GAG AAG TAC GTA GTA GAA AAG GGT TTT GTG GCG ATC 968 
Asp Gin Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly Phe Val Ala He 

135 140 145 

GAC GGT GTG TCG CTG ACT GTA AGC AAG ATG GAT CCA GAT GGC TGT TTC 1016 55 

Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro Asp Gly Cys Phe 
150 155 160 

60 
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TAG ATC TCG. ATG AT^A CAC ACG GAG ACC GCT GTA GCC^ CCA CTC 1064 
TVr He ser Met He Ala His Thr Gin Thr Ala Val Ala Leu Pro Leu 

^"^0 175 180 

5 AAG CCG GAC GGT GCC CTC GTG AAC ATA GAA ACG GAT GTT AAC GGC AAG 

Lys Pro ASP Gly Ala Leu Val Asn He Glu Thr Asp Val Asn Gly Lys 

CTA GTA GAG AAG CAG GTT GCA CAG TAC AAT GCG CAG CTC gH GGT 1160 

Leu val Glu Lys Gin Val Ala Gin -ryr Leu Asn Ala Gin Leu Glu Gly 

205 210 
GAG AGC TCG CCA TTG CAG CGC GTG CTC GAA AGG ATT ATT GAA TCC AAG 
Glu ser ser Pro Leu Gin Arg Val Leu Glu Arg He He Glu Ser Lys 
IS 215 220 . 225 

CTT GCT AGC ATC TCA AAT AAG TGATTATATT ATCTTGGGTG CTGTATATCT l?qp 
Leu Ala Ser He Ser Asn Lvs 



1208 



1319 
1379 
1439 



Ser Asn Lys 
230 235 
TATGTATGTC TTACGACTGT GAATCAGAGG GGTGGCAGCT GGAACACCAG CGACACACCT 
TCGTCTCCCG CGGTGATCAG CCTTCTGTTT TCCTCAAGTA GTACAAAGTC TAGGACACCC 
TGrrOTGGCC AACGCAAACA TGGAGCTGCT GCCCGTTACG CACGTCGAAC TCGTAGACCT 
TGCCGTCAAT GCACGAGGCG AACAGGTGGA AACCGGTGGT C1TGTCAAAC CGCCAGCTTC 1499 
25 GTGACCGAGT CC ^-iv- 3 

(2) INFORMATION ZU SEQ ID NO: 10: ^^^^ 
(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 235 Aininosauren 
^° (B) ART: Aminosaxire 

(D) TOPOLOGIE; linear 
(ii) ART DES MOLEKULS: Protein 
(Xi) SEQUENZBESCHREIBONG: SEQ ID NO- 10- 
35 Met Phe Thr Gly He Val Glu His He Gly^Thr'val Ala Glu Tyr Leu 

^ 10 15 

Glu Asn ASP Ala Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu He 

20 25 30 

Lys Asp Ala Ala Pro He Leu Ala Asp Cys His He Gly Asp Ser He 

35 40 45 

Ala Cys Asn Gly He Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser 

Phe Lys val Gly He Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser 

n, 80 
ser Trp Lys Ala Gly Ser Lys He Asn Leu Glu Arg Ala He Ser Asp 

50 90 95 

Asp Arg Arg Tyr Gly Gly His Tyr Val Gin Gly His Val Asp Ser Val 

100 105 110 

Ala ser He Val Ser Arg Glu His Asp Gly Asn Ser He Asa Phe Lys 
55 „^ 12 0 125 

Phe Lys Leu Arg Asp Gin Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly 
130 135 

Phe val Ala He Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro 
60 150 155 160 
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225 230 235 

(2) INFORMATION ZU SEQ ID NO: 11: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1596 Basenpaare 
(3) ART: Nukleinsaure 

(C) STRANGFOKM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(ill) HYPOTHETISCH: NEIN 

(ill) ANTISENSS: NEIN 25 
(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 
(ix) MERKMALE: 

(A) NAMS/SCHLUSSEL: 5'UTR 30 

(B) LAGE: 1 . , 3 52 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 353 . ,1093 35 
(ix) MERKMALH: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 1094 -.1596 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 40 
AGAAGAAGCG CAGGCGCCAG TCCGAGCTGG AGGAGAACGA GGCGGCGCGG TTGACGAACA 
GCGCGCTGCC CATGGACGAT GCGGGTATAC AGACGGCGGG TATACAGACG GCGGGTGGTG 
CCGAGAGAGG CACCAGGCCG GCTTCCTCCA GCGATGCAAG GAAGAGAAGG GGACCAGAGG 
CGAAGTTCAA GCCATCTAAG GTACAGAAGC CCCAATTGAA GCGAACTGCA TCGTCCCGGG 240 ^. 

CGGATGAGAA CGAGTTCTCG ATATTATAGA GGCCCCCGTT TCGAGTGATT GGCGTCAAAA 
ACGGCTATCT GCCTTCGTCC GCCCCCACCA CCCTCGGGAA CACTGGCAAA CC ATG 

Met 
1 

GCG CTA ATA CCA CTT TCT CAA GAT CTG GCT GAT ATA CTA GCA CCG TAG 
Ala Leu He Pro Leu Ser Gin Asp Leu Ala Asp He Leu Ala Pro Tyr 

5 10 15 

TTA CCG ACA CCA CCG GAG TCA TCC GCA CGC CTG CCG TTT GTC ACG CTG 451 
Leu ^ro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr Leu 
20 25 30 
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f?""- ^^^"^ <^ 499 

Tlxr .yr Ala Gin Ser Leu Asp Ala Arg He Ala Lys Gin Lys Gly Glu 

vll r7 f ^ ^""^ ^^"^ C'^A 

Arg Thr Val He Ser Hxs Glu Glu Thr Lys Thr Met Thr His Tyr Leu 

60 6= 
CGC TAC CAT CAT AGC GGC ATC CTO AIT GGC TCG GGC ACA GCC CTV GCG 
Arg Tyr Hxs Hxs Ser Gly He Leu He Gly Ser Gly Thr Ala Leu 

75 80 
GAC GAC CCG GAT CTC AAT TGC CGG -TCG ACA CCT GCA GCG GAC GGG GCG 
ASP ASP Pro. ASP Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly Ala 

85 90 gg 

GAT TGC ACC GAA CAG TCT TCA CCA CGA CCC ATT ATC TTG GAT GTT CGG 
Asp cys Thr Glu Gin Ser Ser Pro Arg Pro He He Leu Asp Val Arg 

100 105 110 

GGC AGA TGG AGA TAG CGC GGG TCC AAA ATA GAG TAT CTG CAT AAC CTT 
Gly Arg Trp Arg Tyr Arg Gly ser Lys He Glu Tyr Leu His Asn Leu 
115 120 125 

r?S '^'^ ''''^ """^ '"■^ «3T GAG CCG GAG GTC 787 

25 Gly Lys Gly Lys Ala Pro He Val Val Thr Gly Gly Glu Pro Glu Val 

135 140 
CGC GAA CTA GGC GTC AGT TAC CTG CAG CTG GGT GTC GAC GAG GGT GGC 
Arg Glu Leu Gly Val Ser Tyr Leu Gin Leu Gly Val Asp Glu Gly Gly 

CGC TTG AAT TGG GGC GAG TTG TTT GAG III CTC TAT TCT GAG ^C CAC 
Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His His 
« 170 175 

CTG GAA AGT GTC ATG GTC GAA GGC GGC GCG GAG GTG CTC AAC CAG CTG 
Leu Glu ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Sn 12 

185 190 

Leu Leu Arg Pro Asp He Val Asp Ser Leu Val He Thr He Gly Ser 
195 200 205 

Ts pS it rT """^ '''''' ''^^ GTG 
^5 210 "-^^ <51^ Glu val 

215 220 225 

AAC CTA GAG CAT GTG AAC TGG TGG CAC GGA ACA AGT GAC AGT GTT TTG 
Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val Leu 
50 230 235 240 

G?y ITg ITe. ^^^^^'^^^'^ GACTCGTCTA CTAGTTAAAA CTA.TTACTC 

245 

Ar^riSi^i^ TGCGTCACAT AGCGITTATC CCCCTCGCCA ACCGCCTCGT GCCGTTCGAA 
ACACGGCGGC CGGGGGACCT CAAGCGCTCC GCATCGACTA GTTTAATrTA CAAACAGATT 
CTGTAACTTG CGTAACGGCC AGAGGTCTCT GACTTTCTGA TAATCTtSc S^^S 
CGCT^CC CCAGGTATAA TGCAACTTGG ATCCATCCTC TGGATTCTAG GT^C^l 
TTCCTTTAAC CTGTATCTCT TCAACAACTC CTT^TTTTCT TCGTCGCT^A gS^SISSS 
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TTTTGGCACA AGCTCATGOT GCGTGATATT TACCACCAAA GCTGTTTCCT TGAAAGTCTC 1490 
AATTGTAGCA GGAGCGACGG AGGGAAGCAG TTTCAACGCG CTGGGCGTTA TGCCGTTCTG 1550 
ATATATGAAA ATACCCGTCT GGAAGTTCTT CTCGCCAATG TGGATC 1596 
(2) INFORMATION ZO SEQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 246 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtlfLS: Protein 
(xi) SEQUENZBESCHREI3UNG: SSQ ID NO: 12: 
Met Ala Leu lie Pro Leu Ser Gin Asp Leu Ala Asp lie Leu Ala Pro 

15 10 15 

Tyr Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro ?he Val- Thr 

20 25 30 

Leu Thr Tyr Ala Gin Ser Leu Asp Ala Arg lie Ala Lys Gin Lys Gly 

35 40 45 

Glu Arg Thr Val He Ser His Glu Glu Thr Lys Thr Met Thr His Tyr 

50 55 60 

Leu Arg Tyr His His Ser Gly He Leu lie Gly Ser Gly Thr Aia Leu 
65 70 75 80 

Ala Asp ASP Pro Asp Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly 

85 90 95 

Ala Asp Cys Thr Glu Glr. Ser Ser Pro Arg Pro He He Leu Asp Val 

100 105 110 

Arg Gly Arg Trp Arg lyr Arg Gly Ser Lys He Glu oyr Leu His Asn 

115 120 125 

Leu Gly Lys Gly Lys Ala Pro He Val Val Thr Gly Gly Glu Pro Glu 

130 135 140 

Val Arg Glu Leu Gly Val Ser Tyr Leu Gin Leu Gly Val Asp Glu Gly 
145 150 155 150 

Gly Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His 

165 170 175 

Kis Leu Glu ser val Met val Glu Gly Gly Ala Glu val Leu Asn Gin 

180 185 190 

Leu Leu Leu Arg Pro Asp He Val Asp Ser Leu Val He Thr He Gly 

195 200 205 

Ser Lys Phe Leu Gly Ser Leu Gly val Ala val Ser Pro Ala Glu Glu 

210 215 220 

val Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val 
225 230 235 240 

Leu Cys Gly Arg Leu Ala 
245 

PatentansprQche 
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ohne die enzymatische ^^l^ng des Polypeptids wesentlich zu reduziert^^ 

4. DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 8 dargestellten Aminosauresequenz 
codieren oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 8. worin eine oder 
mehrere Aminosauren deletiert, hinzugefugt oder durch andere Aminosauren substituiert worden sind» 
ohne die enzymatische Wirkung des Polypeptids wesentlich zu reduzieren. 

5. DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 10 dargestellten Aminosauresequenz 
codieren oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 10, worin eine oder 
mehrere Aminosauren deletiert, hinzugefugt oder durch andere Aminosauren substituiert worden sind, 
ohne die enzymatische Wirkung des Polypeptids wesentlich zu reduzieren. 

6. DNA-Sequenzen. die fur ein Polypeptid mit der in SEQ ID NO: 12 dargestellten Aminosauresequenz 
codieren oder fur ein Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 12, worin eine oder 
mehrere Aminosauren deletiert, hinzugefugt oder durch andere Aminosauren substituiert worden sind, 
ohne die enzymatische Wirkung des Polypeptids wesentlich zu reduzieren. 

7. Expressionsvektor. enthaltend eine oder mehrere DNA-Sequenzen gemaB Anspruch 1 bis 6. 

8. Wirtsorganismus der mit einem Expressionssystem gemaB Anspruch 7 transformiert worden ist 

9. Rekombinantes Hersteilverfahren fur Riboflavin, dadurch gekennzeichnet, daB ein Wirtsorganismus 
gemaB Anspruch 8 verwendet wird. 
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